DRIFT: Optimización eficiente de modelos de lenguaje en múltiples turnos
DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.
DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.